Source | # of sentences | Average logarithmic rank |
---|---|---|
http://or.wikipedia.org/wiki/ବିଦୁସ୍ମିତା | 12 | 4.52 |
http://or.wikipedia.org/wiki/ହର_ରଥ | 11 | 4.64 |
http://or.wikipedia.org/wiki/ସୁଧାକର_ବସନ୍ତ | 11 | 4.77 |
http://or.wikipedia.org/wiki/ବିଜୟ_ମହାନ୍ତି | 16 | 4.81 |
http://or.wikipedia.org/wiki/ହୃଦାନନ୍ଦ_ମଲ୍ଲିକ | 12 | 4.84 |
http://or.wikipedia.org/wiki/ନମ୍ରତା_ଦାସ | 14 | 4.88 |
http://or.wikipedia.org/wiki/ରକୁଲ_ପ୍ରୀତ_ସିଂହ | 12 | 4.89 |
http://or.wikipedia.org/wiki/ସୁଧାଂଶୁମାଳିନୀ_ରାୟ | 13 | 4.92 |
http://or.wikipedia.org/wiki/ଜୟା_ଆହସାନ | 17 | 4.92 |
http://or.wikipedia.org/wiki/ଶୈରିନ୍ଦ୍ରୀ_ନାୟକ | 13 | 4.92 |
http://or.wikipedia.org/wiki/ଅଞ୍ଜଳି_ବେହେରା | 16 | 4.94 |
http://or.wikipedia.org/wiki/ଉମାରାଣୀ_ପାତ୍ର | 15 | 4.94 |
http://or.wikipedia.org/wiki/ହାତ,_ପାଦ_ଓ_ପାଟି_ରୋଗ | 16 | 4.95 |
http://or.wikipedia.org/wiki/ଉଷା_ଦେବୀ | 13 | 4.97 |
http://or.wikipedia.org/wiki/ଲଳିତ_ମାନସିଂହ | 11 | 4.97 |
http://or.wikipedia.org/wiki/ଜାନକୀ_ବଲ୍ଲଭ_ମହାନ୍ତି_(ଭରଦ୍ୱାଜ) | 14 | 5.01 |
http://or.wikipedia.org/wiki/କାର୍ପାଲ_ଟନେଲ_ସିଣ୍ଡ୍ରୋମ | 11 | 5.02 |
http://or.wikipedia.org/wiki/ଆଟୋପିକ_ଡର୍ମାଟାଇଟିସ | 22 | 5.02 |
http://or.wikipedia.org/wiki/ଦେବାଶିଷ_ପାତ୍ର | 13 | 5.03 |
http://or.wikipedia.org/wiki/ଅପପଠନ | 14 | 5.04 |
http://or.wikipedia.org/wiki/ରତ୍ନ_ମଞ୍ଜରୀ_ଦେବୀ | 11 | 5.04 |
http://or.wikipedia.org/wiki/ପୁପିନ୍ଦର_ସିଂହ | 13 | 5.04 |
http://or.wikipedia.org/wiki/ଅନୁଭା_ସୌର୍ଯ୍ୟା | 13 | 5.05 |
http://or.wikipedia.org/wiki/କ୍ରାନ୍ତିଧାରା | 11 | 5.06 |
http://or.wikipedia.org/wiki/ଏଲିନା_ସାମନ୍ତରାୟ | 19 | 5.06 |
http://or.wikipedia.org/wiki/ରଘୁବୀର_ଚୌଧୁରୀ | 14 | 5.06 |
http://or.wikipedia.org/wiki/ତୃପ୍ତି_ସିହ୍ନା | 14 | 5.06 |
http://or.wikipedia.org/wiki/ଉଦ୍ବେଗ_ଅବ୍ୟବସ୍ଥା | 13 | 5.07 |
http://or.wikipedia.org/wiki/ବେଦ_ପ୍ରକାଶ_ଅଗ୍ରୱାଲ | 14 | 5.07 |
http://or.wikipedia.org/wiki/ଇଶ୍ରାତ୍_ଜାହାଁ_ଚୈତି | 11 | 5.07 |
Source | # of sentences | Average logarithmic rank |
---|---|---|
http://or.wikipedia.org/wiki/ହିନ୍ଦୁସ୍ତାନ_ପେଟ୍ରୋଲିୟମ | 12 | 7.95 |
http://or.wikipedia.org/wiki/ଓଡ଼ିଶାରେ_ସାଧବ_ସଂସ୍କୃତି | 23 | 7.85 |
http://or.wikipedia.org/wiki/ଜୈବପ୍ରଯୁକ୍ତି | 51 | 7.74 |
http://or.wikipedia.org/wiki/ଭାରତ_ପେଟ୍ରୋଲିୟମ | 11 | 7.67 |
http://or.wikipedia.org/wiki/ଗୁଗଲ_ନାଓ | 19 | 7.59 |
http://or.wikipedia.org/wiki/ନକ୍ସଲବାଦ | 12 | 7.57 |
http://or.wikipedia.org/wiki/ସାଇନା_ନେହୱାଲ | 18 | 7.56 |
http://or.wikipedia.org/wiki/ଗରୁଡ଼_କମାଣ୍ଡୋ | 27 | 7.54 |
http://or.wikipedia.org/wiki/ଶୁଲିଆ_ଯାତ୍ରା | 21 | 7.53 |
http://or.wikipedia.org/wiki/କଉଡ଼ି | 20 | 7.52 |
http://or.wikipedia.org/wiki/ଇଦ_ଉଲ-ଫିତର | 14 | 7.51 |
http://or.wikipedia.org/wiki/ଭଦ୍ରକ_ଜିଲ୍ଲା | 50 | 7.50 |
http://or.wikipedia.org/wiki/ଜଳଭୀତିଅଣୁ | 20 | 7.49 |
http://or.wikipedia.org/wiki/ଉଦ୍ଭିଦ_ବିଜ୍ଞାନ | 35 | 7.49 |
http://or.wikipedia.org/wiki/ହରପ୍ପା_ସଭ୍ୟତା | 20 | 7.47 |
http://or.wikipedia.org/wiki/କଣ୍ଟାକୁସୁମ | 14 | 7.44 |
http://or.wikipedia.org/wiki/ଭଦ୍ରକ | 44 | 7.44 |
http://or.wikipedia.org/wiki/ବାଜିରାଓ_୧ | 12 | 7.43 |
http://or.wikipedia.org/wiki/ବାମ୍ବୁ_ଚିକେନ୍ | 14 | 7.42 |
http://or.wikipedia.org/wiki/ଦ୍ୱିଆଜୋଭୋଜୀ | 29 | 7.42 |
http://or.wikipedia.org/wiki/ଆସନ | 12 | 7.42 |
http://or.wikipedia.org/wiki/ମୃଗବିହାର | 13 | 7.38 |
http://or.wikipedia.org/wiki/ଅଜିମ୍_ପ୍ରେମଜୀ | 16 | 7.37 |
http://or.wikipedia.org/wiki/ପାନ | 58 | 7.35 |
http://or.wikipedia.org/wiki/ଆଲଫ୍ରେଡ଼_ନୋବେଲ | 38 | 7.35 |
http://or.wikipedia.org/wiki/କୋହିମା | 12 | 7.34 |
http://or.wikipedia.org/wiki/ବିର୍ସା_ମୁଣ୍ଡା | 45 | 7.32 |
http://or.wikipedia.org/wiki/ପଳାଶ | 12 | 7.31 |
http://or.wikipedia.org/wiki/ଲସ_ଏଞ୍ଜଲେସ_ଲେକର୍ସ | 11 | 7.30 |
http://or.wikipedia.org/wiki/ଗୋବିନ୍ଦା(ଅଭିନେତା) | 21 | 7.29 |
In this subsection we replace average word length by average logarithmic word rank. The logarithm of the word rank is taken because we want to punish words of high ranks only moderately.
First table:
select source, count(distinct i_s.s_id) as cnt_s, round(avg(log(w.w_id-100)),2) as av from sources so, inv_so i_s, inv_w i, words w where so.so_id=i_s.so_id and i_s.s_id=i.s_id and i.w_id=w.w_id and w.w_id>100 group by source having cnt_s>10 order by av LIMIT 30;
6.4.2.1 Average word length for different sources
6.4.2.3 Sources consisting of many / few words with frequency 1
6.4.2.4 Sources with low / high average word length of rare words